tg-me.com/machinelearning_interview/1761
Last Update:
Describe Anything Model (DAM) - Π°ΡΡ
ΠΈΡΠ΅ΠΊΡΡΡΠ°, ΡΠ°Π·ΡΠ°Π±ΠΎΡΠ°Π½Π½Π°Ρ Nvidia, Π΄Π»Ρ Π³Π΅Π½Π΅ΡΠ°ΡΠΈΠΈ ΡΠΎΡΠ½ΡΡ
ΠΈ Π΄Π΅ΡΠ°Π»ΡΠ½ΡΡ
ΠΎΠΏΠΈΡΠ°Π½ΠΈΠΉ Π΄Π»Ρ ΠΊΠΎΠ½ΠΊΡΠ΅ΡΠ½ΡΡ
ΠΎΠ±Π»Π°ΡΡΠ΅ΠΉ Π½Π° ΠΈΠ·ΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΈΡΡ
ΠΈ Π²ΠΈΠ΄Π΅ΠΎ. Π’ΡΠ°Π΄ΠΈΡΠΈΠΎΠ½Π½ΡΠ΅ VLM-ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΊΠ°ΠΊ ΠΎΡΠ΄Π΅Π»ΡΠ½Π°Ρ ΡΡΡΠ½ΠΎΡΡΡ ΠΈΠ»ΠΈ Π² ΡΠ²ΡΠ·ΠΊΠ΅ Ρ SAM-ΠΏΠΎΠΌΠΎΡΠ½ΠΈΠΊΠ°ΠΌΠΈ ΡΠ°ΡΡΠΎ ΡΠ΅ΡΡΡΡ Π½ΡΡΠ°Π½ΡΡ, ΠΎΡΠΎΠ±Π΅Π½Π½ΠΎ ΠΏΡΠΈ Π½Π°Π»ΠΈΡΠΈΠΈ ΠΌΠ΅Π»ΠΊΠΈΡ
ΠΎΠ±ΡΠ΅ΠΊΡΠΎΠ² ΠΈΠ»ΠΈ Π΄ΠΈΠ½Π°ΠΌΠΈΡΠ½ΡΡ
ΡΡΠ΅Π½ Π½Π° ΡΠ΅Π»Π΅Π²ΠΎΠΌ ΠΈΡΡΠΎΡΠ½ΠΈΠΊΠ΅.
DAM ΡΠΏΡΠ°Π²Π»ΡΠ΅ΡΡΡ Ρ ΡΡΠΈΠΌ Π·Π° ΡΡΠ΅Ρ 2 ΠΈΠ½Π½ΠΎΠ²Π°ΡΠΈΠΉ Π² ΡΠ²ΠΎΠ΅ΠΉ Π°ΡΡ
ΠΈΡΠ΅ΠΊΡΡΡΠ΅:
ΠΠΎΠ΄Π΅Π»Ρ ΠΏΡΠΈΠ½ΠΈΠΌΠ°Π΅Ρ ΠΈΠ·ΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΈΠ΅ ΠΈΠ»ΠΈ Π²ΠΈΠ΄Π΅ΠΎ ΠΈ Π±ΠΈΠ½Π°ΡΠ½ΡΡ ΠΌΠ°ΡΠΊΡ ΡΠ΅Π»Π΅Π²ΠΎΠΉ ΠΎΠ±Π»Π°ΡΡΠΈ ΠΈΠ½ΡΠ΅ΡΠ΅ΡΠ°. ΠΠ»ΠΎΠ±Π°Π»ΡΠ½ΡΠΉ ΡΠ½ΠΊΠΎΠ΄Π΅Ρ ΠΈΠ·Π²Π»Π΅ΠΊΠ°Π΅Ρ ΠΎΠ±ΡΠΈΠ΅ ΠΏΡΠΈΠ·Π½Π°ΠΊΠΈ, ΡΠ΅Π³ΠΈΠΎΠ½Π°Π»ΡΠ½ΡΠΉ β ΡΠΎΠΊΡΡΠΈΡΡΠ΅ΡΡΡ Π½Π° Π΄Π΅ΡΠ°Π»ΡΡ
Π²ΡΠ±ΡΠ°Π½Π½ΠΎΠΉ Π·ΠΎΠ½Ρ. Π§Π΅ΡΠ΅Π· Π°Π΄Π°ΠΏΡΠ΅ΡΡ Ρ ΠΊΡΠΎΡΡ-Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅ΠΌ ΠΏΡΠΈΠ·Π½Π°ΠΊΠΈ ΠΎΠ±ΡΠ΅Π΄ΠΈΠ½ΡΡΡΡΡ, ΠΏΠΎΡΠ»Π΅ ΡΠ΅Π³ΠΎ LLM Π³Π΅Π½Π΅ΡΠΈΡΡΠ΅Ρ ΠΎΠΏΠΈΡΠ°Π½ΠΈΠ΅. ΠΠ»Ρ Π²ΠΈΠ΄Π΅ΠΎ ΠΌΠ°ΡΠΊΠΈ ΠΏΡΠΈΠΌΠ΅Π½ΡΡΡΡΡ ΠΊ ΠΊΠ°ΠΆΠ΄ΠΎΠΌΡ ΠΊΠ°Π΄ΡΡ, Π° ΠΏΡΠΈΠ·Π½Π°ΠΊΠΈ Π°Π³ΡΠ΅Π³ΠΈΡΡΡΡΡΡ Π²ΠΎ Π²ΡΠ΅ΠΌΠ΅Π½ΠΈ.
# Clone the repo
git clone https://github.com/NVlabs/describe-anything
cd describe-anything
# Create a conda env
conda create -n describe-anything
conda activate describe-anything
# Install dependencies
pip install -v
# Gradio Demo for Image Descriptions
python demo_simple.py
# Gradio Demo for Video Descriptions
python demo_video.py
@ai_machinelearning_big_data
#AI #ML #DAM #NVIDIA #Annotation